内発的動機づけ型強化学習(intrinsically motivated RL)
餌やお金などの外的報酬(extrinsic rewards)は現実世界では疎(Sparse)にしか存在しない
この問題に対処するため、以下のような内的報酬(intrinsic rewards)も利用して行動を決定する強化学習(Reinforcement Learning; RL)
新規性(novelty)
サプライズ(surprise)
情報利得(information gain)
Intrinsically Motivated Reinforcement Learning: An Evolutionary Perspective|IEEE Trans Auton Ment Dev(2010)